I) INTRODUCTION

La visualisation de données désigne la représentation graphique d’informations et de données. Elle est aujourd’hui exploitée par de nombreuses entreprises qui gèrent de vastes volumes de données issues notamment de base de donéees, de CRM ou encore de tableurs. Ces entreprises la privilégient désormais pour les raisons suivantes :

Elle est donc devenu indispensable pour analyser d’énormes quantité d’informations ou étudier de grand volumes de données et joue un role de plus en plus important dans les domaines scientifiques et techniques, dans l’administration, dans la finance, en marketing, dans le secteur des services ou dans le sport.

II) OBJECTIFS DU PROJET

Ce projet, réalisé dans le cadre du cours de visualisation de données, consiste a :

III) PRESENTATION DES DONNEES

Le jeu de données utilisé pour notre analyse, concernent le domaine du football. Il rassemble l’ensemble des observations sur plus de 17.588 footballeurs decrient par 53 variables. Ces différentes caractéristiques datent de 2017 et proviennent d’analyses de différents spécialistes du domaine du football. Pour une meilleure lisibilite, nous n’allons afficher que les 4 premieres variables des 10 premiers individus de notre jeu de données :

Nom Nationalite Club Position Evaluation
CRISTIANO RONALDO PORTUGAL REAL MADRID AILIER 94
LIONEL MESSI ARGENTINA FC BARCELONA AILIER 93
NEYMAR BRAZIL FC BARCELONA AILIER 92
LUIS SUAREZ URUGUAY FC BARCELONA ATTAQUANT 92
MANUEL NEUER GERMANY FC BAYERN GARDIEN 92
DE GEA SPAIN MANCHESTER UTD GARDIEN 90
ROBERT LEWANDOWSKI POLAND FC BAYERN ATTAQUANT 90
GARETH BALE WALES REAL MADRID AILIER 90
ZLATAN IBRAHIMOVIC SWEDEN MANCHESTER UTD ATTAQUANT 90
THIBAUT COURTOIS BELGIUM CHELSEA GARDIEN 89

Apres avoir affiné nos données, elles contiennent maintenant 150 observations et 25 variables, toutes decrivant les caractéristiques propres a chacun des footballeurs.

## Classes 'tbl_df', 'tbl' and 'data.frame':    150 obs. of  25 variables:
##  $ Nom               : chr  "CRISTIANO RONALDO" "LIONEL MESSI" "NEYMAR" "LUIS SUAREZ" ...
##  $ Nationalite       : Factor w/ 34 levels "ALGERIA","ARGENTINA",..: 25 2 7 33 18 30 24 34 31 5 ...
##  $ Club              : Factor w/ 35 levels "1. FC KOLN","ARSENAL",..: 29 13 13 13 14 23 14 29 23 10 ...
##  $ Position          : Factor w/ 11 levels "AILIER","ATTAQUANT",..: 1 1 1 2 6 6 2 1 2 6 ...
##  $ Evaluation        : int  94 93 92 92 92 90 90 90 90 89 ...
##  $ Taille_en_cm      : int  185 170 174 182 193 193 185 183 195 199 ...
##  $ Poids_en_kg       : int  80 72 68 85 92 82 79 74 95 91 ...
##  $ Pied_Fort         : Factor w/ 2 levels "DROIT","GAUCHE": 1 2 1 1 1 1 1 2 1 2 ...
##  $ Age               : int  32 29 25 30 31 26 28 27 35 24 ...
##  $ Pied_Faible       : Factor w/ 5 levels "1","2","3","4",..: 4 4 5 4 4 3 4 3 4 3 ...
##  $ Dribbles          : int  92 96 95 88 39 22 86 88 88 18 ...
##  $ Defense           : int  25 22 26 37 10 15 28 52 27 15 ...
##  $ Attaque           : int  90 87 86 90 24 21 87 83 89 18 ...
##  $ Interception      : int  29 22 36 41 30 30 39 59 20 15 ...
##  $ Vision_du_Jeu     : int  85 90 80 84 70 68 78 79 83 44 ...
##  $ Centre            : int  84 77 75 77 15 17 62 87 76 14 ...
##  $ Passe             : int  80 87 78 73 57 31 74 83 80 31 ...
##  $ Rapidite          : int  91 89 91 82 59 56 80 94 71 49 ...
##  $ Endurance         : int  92 74 79 89 44 25 79 78 75 38 ...
##  $ Force             : int  80 59 49 76 83 64 84 80 93 70 ...
##  $ Equilibre         : int  63 95 82 60 35 43 79 65 41 45 ...
##  $ Agilite           : int  90 90 96 86 52 57 78 77 86 61 ...
##  $ Tete              : int  85 71 62 77 25 21 85 86 80 13 ...
##  $ Frappe            : int  91 86 77 86 20 21 84 90 90 26 ...
##  $ Competence_Gardien: int  11 10 11 30 90 87 10 10 11 83 ...
##      Nom               Nationalite             Club   
##  Length:150         SPAIN    :23   REAL MADRID   :14  
##  Class :character   GERMANY  :19   FC BAYERN     :13  
##  Mode  :character   BRAZIL   :14   JUVENTUS      :13  
##                     FRANCE   :14   FC BARCELONA  :12  
##                     ARGENTINA:13   CHELSEA       : 9  
##                     BELGIUM  : 9   MANCHESTER UTD: 9  
##                     (Other)  :58   (Other)       :80  
##              Position    Evaluation     Taille_en_cm    Poids_en_kg   
##  DEFENSEUR CENTRE:34   Min.   :82.00   Min.   :163.0   Min.   :59.00  
##  MILIEUX CENTRAL :24   1st Qu.:84.00   1st Qu.:176.2   1st Qu.:73.00  
##  GARDIEN         :20   Median :85.00   Median :183.5   Median :77.50  
##  AILIER          :19   Mean   :85.56   Mean   :182.5   Mean   :77.82  
##  ATTAQUANT       :19   3rd Qu.:87.00   3rd Qu.:188.0   3rd Qu.:83.75  
##  MILIEUX DEFENSIF: 9   Max.   :94.00   Max.   :199.0   Max.   :96.00  
##  (Other)         :25                                                  
##   Pied_Fort        Age        Pied_Faible    Dribbles        Defense     
##  DROIT :118   Min.   :22.00   1: 1        Min.   :13.00   Min.   :10.00  
##  GAUCHE: 32   1st Qu.:25.00   2:20        1st Qu.:64.25   1st Qu.:26.25  
##               Median :28.00   3:68        Median :81.00   Median :54.00  
##               Mean   :27.77   4:53        Mean   :71.24   Mean   :52.51  
##               3rd Qu.:30.00   5: 8        3rd Qu.:86.00   3rd Qu.:82.75  
##               Max.   :39.00               Max.   :96.00   Max.   :91.00  
##                                                                          
##     Attaque       Interception   Vision_du_Jeu       Centre     
##  Min.   :11.00   Min.   :15.00   Min.   :22.00   Min.   : 9.00  
##  1st Qu.:47.25   1st Qu.:35.00   1st Qu.:57.25   1st Qu.:52.50  
##  Median :71.00   Median :62.50   Median :76.50   Median :72.00  
##  Mean   :61.33   Mean   :57.69   Mean   :71.23   Mean   :62.73  
##  3rd Qu.:78.00   3rd Qu.:83.75   3rd Qu.:84.00   3rd Qu.:80.00  
##  Max.   :90.00   Max.   :93.00   Max.   :94.00   Max.   :90.00  
##                                                                 
##      Passe          Rapidite       Endurance         Force      
##  Min.   :25.00   Min.   :42.00   Min.   :25.00   Min.   :42.00  
##  1st Qu.:65.25   1st Qu.:67.00   1st Qu.:69.00   1st Qu.:65.00  
##  Median :77.00   Median :74.00   Median :75.00   Median :75.00  
##  Mean   :71.07   Mean   :72.91   Mean   :72.31   Mean   :72.89  
##  3rd Qu.:82.00   3rd Qu.:81.75   3rd Qu.:82.00   3rd Qu.:81.00  
##  Max.   :91.00   Max.   :95.00   Max.   :94.00   Max.   :93.00  
##                                                                 
##    Equilibre        Agilite           Tete           Frappe     
##  Min.   :30.00   Min.   :33.00   Min.   :10.00   Min.   :16.00  
##  1st Qu.:55.00   1st Qu.:60.00   1st Qu.:54.00   1st Qu.:58.25  
##  Median :67.00   Median :76.50   Median :68.00   Median :74.00  
##  Mean   :67.48   Mean   :72.87   Mean   :62.08   Mean   :65.53  
##  3rd Qu.:81.75   3rd Qu.:85.00   3rd Qu.:80.00   3rd Qu.:81.00  
##  Max.   :95.00   Max.   :96.00   Max.   :94.00   Max.   :91.00  
##                                                                 
##  Competence_Gardien
##  Min.   : 1.00     
##  1st Qu.: 9.00     
##  Median :10.00     
##  Mean   :19.13     
##  3rd Qu.:11.00     
##  Max.   :90.00     
## 

Les relations entre ces 25 différentes variables sont demontrées par la représentation suivante. Cette representation contient le nom des colonnes numeriques classées dans l’ordre croissant, de Evaluation a Competence_Gardien, du bas vers le haut. Pour une meilleure compréhension nous allons d’abord afficher le nom des differentes colonnes de notre jeu de données.

##  [1] "Nom"                "Nationalite"        "Club"              
##  [4] "Position"           "Evaluation"         "Taille_en_cm"      
##  [7] "Poids_en_kg"        "Pied_Fort"          "Age"               
## [10] "Pied_Faible"        "Dribbles"           "Defense"           
## [13] "Attaque"            "Interception"       "Vision_du_Jeu"     
## [16] "Centre"             "Passe"              "Rapidite"          
## [19] "Endurance"          "Force"              "Equilibre"         
## [22] "Agilite"            "Tete"               "Frappe"            
## [25] "Competence_Gardien"

Ce graphe représente la correlation entre les différentes variables de notre jeu de données. Premièrement, nous pouvons remarquer que plus le carré est bleu (tres proche de -1.0), et moins il y a de relation entre les 2 variables. A l’exemple de Competence_Gardien et Frappe ou Competence_Gardien et Dribbles, ce qui est tout a fait normal car très peu de gardien de but, voir aucun, ne possede une bonne qualite de frappe ou de dribbles.

Deuxiemement, plus le carré est orange (tres proche de 1.0), et plus il y a de relation entre les 2 variables. A l’exemple de Frappe et Attaque, ce qui est tout aussi normal car la plupart des joueurs offensifs (attaquants) possèdent de bonnes capacités face au but.

L’ensemble des individus de notre jeu de données est le suivant :

Pour représenter les gardiens, nous allons utiliser les variables Competence_Gardien et Evaluation :

Pour représenter le secteur defensif, nous allons utiliser les variables Defense et Interception :

Pour representer le secteur offensif, nous allons utiliser les variables Attaque et Dribbles :

Nos données sont composées de 5 variables de types “factor”, dont les plus importantes dans le dommaine du football : Position, Age, Pied_Fort qui représentent respectivement la position préférencielle du joueur sur le terrain, son age, et son pied fort.

  1. La variable “Position”

Les différentes positions présentes dans notre jeu de données sont les suivantes :

Gardiens : Nous pouvons constater sur ce graphe qu’il y a 20 gardien.

Nom Nationalite Club Position Evaluation Taille_en_cm Poids_en_kg Pied_Fort
MANUEL NEUER GERMANY FC BAYERN GARDIEN 92 193 92 DROIT
DE GEA SPAIN MANCHESTER UTD GARDIEN 90 193 82 DROIT
THIBAUT COURTOIS BELGIUM CHELSEA GARDIEN 89 199 91 GAUCHE
HUGO LLORIS FRANCE SPURS GARDIEN 88 188 82 GAUCHE
PETR CECH CZECH REPUBLIC ARSENAL GARDIEN 88 196 90 GAUCHE
GIANLUIGI BUFFON ITALY JUVENTUS GARDIEN 88 192 91 DROIT

Défenseurs (Centre, Gauche, Droit) : Nous pouvons constater sur ce graphe qu’il y a 34 “DEFENSEUR CENTRE”, 3 “DEFENSEUR DROIT” et 4 “DEFENSEUR GAUCHE”

Nom Nationalite Club Position Evaluation Taille_en_cm Poids_en_kg Pied_Fort
JEROME BOATENG GERMANY FC BAYERN DEFENSEUR CENTRE 89 192 90 DROIT
THIAGO SILVA BRAZIL PSG DEFENSEUR CENTRE 89 183 79 DROIT
SERGIO RAMOS SPAIN REAL MADRID DEFENSEUR CENTRE 89 183 75 DROIT
DIEGO GODIN URUGUAY ATLETICO MADRID DEFENSEUR CENTRE 88 185 73 DROIT
MATS HUMMELS GERMANY FC BAYERN DEFENSEUR CENTRE 88 191 92 DROIT
GIORGIO CHIELLINI ITALY JUVENTUS DEFENSEUR CENTRE 88 187 84 GAUCHE

Milieux (Defensif, Central, Gauche, Droit, Offensif) : Nous pouvons constater sur ce graphe que notre jeu de données sur les Milieux contient beaucoup plus de poste “MILIEUX CENTRAL”

Nom Nationalite Club Position Evaluation Taille_en_cm Poids_en_kg Pied_Fort
LUKA MODRIC CROATIA REAL MADRID MILIEUX CENTRAL 89 174 65 DROIT
MESUT OZIL GERMANY ARSENAL MILIEUX OFFENSIF 89 180 76 GAUCHE
PAUL POGBA FRANCE MANCHESTER UTD MILIEUX CENTRAL 88 191 84 DROIT
KEVIN DE BRUYNE BELGIUM MANCHESTER CITY MILIEUX CENTRAL 88 181 68 DROIT
TONI KROOS GERMANY REAL MADRID MILIEUX CENTRAL 88 182 78 DROIT
INIESTA SPAIN FC BARCELONA MILIEUX GAUCHE 88 171 68 DROIT

Attaquants (Ailier, Attaquant) : Nous pouvons constater que notre jeu de donnees est compose d’autant d’ailier que d’attaquants normaux.

Nom Nationalite Club Position Evaluation Taille_en_cm Poids_en_kg Pied_Fort
CRISTIANO RONALDO PORTUGAL REAL MADRID AILIER 94 185 80 DROIT
LIONEL MESSI ARGENTINA FC BARCELONA AILIER 93 170 72 GAUCHE
NEYMAR BRAZIL FC BARCELONA AILIER 92 174 68 DROIT
LUIS SUAREZ URUGUAY FC BARCELONA ATTAQUANT 92 182 85 DROIT
ROBERT LEWANDOWSKI POLAND FC BAYERN ATTAQUANT 90 185 79 DROIT
GARETH BALE WALES REAL MADRID AILIER 90 183 74 GAUCHE

Le joueur se caractérise aussi par sa note globale (Evaluation) qui lui est attribue. Nous allons afficher la repartition des joueurs par evaluation. Par la suite nous allons vous montrer la distribution globale des evaluations de ceux ci par rapport a leur poste respectifs.

Nous pouvons constater sur le premier graphe que la plus petite evaluation est 82 car grace un simple coup d’oeil nous pouvons deduire que la ligne horizontale situee entre 85 et 90 est 87.5. Par consequent celle situe avant 85 est 82.5. Ce qui nous emmene a penser a juste titre que l’evaluation la plus petite est 82 et est possede par 1 seul joueur. Et la plus grande, 94, possede par 1 seul joueur.

Sur le second graphe nous pouvons observer le nombre de joueurs par poste (detaille) et d’un simple coup d’oeil, en deduire que le poste le represente est “DEFENSEUR CENTRE” suivi par “MILIEUX CENTRAL” et ainsi de suite.

Pour evoluer à certains postes, le joueur doit posseder certains critères. Certains postes nécessitent d’être particulierement grand et costaud ou au contraire moins grand, rapide et agile comme en temoignent les représentations suivantes :

Ces représentations nous demontrent que :

  1. La variable “Age”

Notre jeu de données contient des joueurs agés de 22 a 39 ans. Le graphe suivant nous montre la repartition globale des joueurs selon leur age.

Ce graphe nous démontre que notre jeu de données contient par exemple 5 joueurs de 22 ans ou encore 20 joueurs de 29 ans.

Le graphe suivant nous présente la repartition et la moyenne d’age de notre jeu de données :

L’age est un attribut assez important pour un sportif et encore plus pour un joueur de football. Les joueurs sont repatis comme suit selon leur age :

Pour les gardiens :

Pour les defenseurs :

Pour les milieux :

Pour les attaquants :

Sachant que notre jeu de données contient les 150 meilleurs joueurs de football, ces graphes nous démontrent que la plupart des joueurs de football ont de forte chance d’atteindre leur meilleur niveau entre 25 et 30 ans.

  1. La variable “Pied_Fort”

La variable Pied_Fort represente le pied fort du joueur a savoir le droit ou le gauche.

Grace aux graphes ci dessus, nous remarquons que dans ce jeu de données, nous avons moins de gaucher que de droitier. Sur le premier et le deuxieme graphe nous le voyons clairement. Par contre sur le deuxieme graphe, nous constatons que les gauchers ont une moyenne d’évaluation beaucoup plus elevée grace a leur nombre reduit. Ce qui ne signifie pas forcement qu’ils sont meilleurs que les droitier. Les troisième et le quatrième graphes nous montrent respectivement la repatition par nom des gauchers et des droitiers.

Dans le domaine du football cette variable est très importante pour determiner le positionnement d’un joueur :

Nom Position Pied_Fort
THIBAUT COURTOIS GARDIEN GAUCHE
HUGO LLORIS GARDIEN GAUCHE
PETR CECH GARDIEN GAUCHE
TIMO HORN GARDIEN GAUCHE
ANTHONY LOPES GARDIEN GAUCHE
Nom Position Pied_Fort
MANUEL NEUER GARDIEN DROIT
DE GEA GARDIEN DROIT
GIANLUIGI BUFFON GARDIEN DROIT
JAN OBLAK GARDIEN DROIT
SAMIR HANDANOVIC GARDIEN DROIT
BERND LENO GARDIEN DROIT

Concernant les gardiens nous pouvons constater qu’il y a 5 gauchers et 15 droitiers. Nous n’allons pas parler des differents postes car il y a qu’une seule variante dans la zone du gardien.

Nom Position Pied_Fort
GIORGIO CHIELLINI DEFENSEUR CENTRE GAUCHE
DAVID ALABA DEFENSEUR GAUCHE GAUCHE
JORDI ALBA DEFENSEUR CENTRE GAUCHE
MARCELO DEFENSEUR GAUCHE GAUCHE
FILIPE LUIS DEFENSEUR GAUCHE GAUCHE
AYMERIC LAPORTE DEFENSEUR CENTRE GAUCHE
Nom Position Pied_Fort
JEROME BOATENG DEFENSEUR CENTRE DROIT
THIAGO SILVA DEFENSEUR CENTRE DROIT
SERGIO RAMOS DEFENSEUR CENTRE DROIT
DIEGO GODIN DEFENSEUR CENTRE DROIT
MATS HUMMELS DEFENSEUR CENTRE DROIT
PHILIPP LAHM DEFENSEUR DROIT DROIT

Concernant les defenseurs nous pouvons constater qu’il y a 8 gauchers et 33 droitiers. Nous pouvons constater qu’un defenseur gaucher ne peut se positionner qu’au centre et a gauche, rarement a droite. Et vice versa pour les droitiers.

Nom Position Pied_Fort
MESUT OZIL MILIEUX OFFENSIF GAUCHE
JAMES RODRIGUEZ MILIEUX OFFENSIF GAUCHE
DAVID SILVA MILIEUX CENTRAL GAUCHE
ARJEN ROBBEN MILIEUX DROIT GAUCHE
PAULO DYBALA MILIEUX OFFENSIF GAUCHE
JUAN MATA MILIEUX CENTRAL GAUCHE
Nom Position Pied_Fort
LUKA MODRIC MILIEUX CENTRAL DROIT
PAUL POGBA MILIEUX CENTRAL DROIT
KEVIN DE BRUYNE MILIEUX CENTRAL DROIT
TONI KROOS MILIEUX CENTRAL DROIT
INIESTA MILIEUX GAUCHE DROIT
ARTURO VIDAL MILIEUX DEFENSIF DROIT

Concernant les milieux, nous avons 12 gauchers et 39 droitiers. Nous pouvons constater que lorsqu’un milieux de terrain est gaucher, il peut se positionner a gauche, au centre ou a droite selon sa capacite a etre efficace et influent sur l’un des deux cotes. Il est est de meme pour les droitier. En d’autre terme le pied fort n’influence pas grandement le positionnement d’un milieux de terrain.

Nom Position Pied_Fort
LIONEL MESSI AILIER GAUCHE
GARETH BALE AILIER GAUCHE
ANTOINE GRIEZMANN ATTAQUANT GAUCHE
ANGEL DI MARIA AILIER GAUCHE
ROMELU LUKAKU ATTAQUANT GAUCHE
NICOLAS GAITAN AILIER GAUCHE
Nom Position Pied_Fort
CRISTIANO RONALDO AILIER DROIT
NEYMAR AILIER DROIT
LUIS SUAREZ ATTAQUANT DROIT
ROBERT LEWANDOWSKI ATTAQUANT DROIT
ZLATAN IBRAHIMOVIC ATTAQUANT DROIT
EDEN HAZARD AILIER DROIT

Concernant les attaquants, nous avons 7 gauchers et 31 droitiers. Nous pouvons constater que le pied fort n’influence pas grandement le positionnement de l’attaquant. Tout comme pour le milieux, sa position dependra de sa preference ou sa capacite a etre efficace et influent sur le terrain.

Sur les graphes qui suivent les differentes matrices de chaque poste, nous faisons la même remarque a savoir que les gauchers sont moins nombreux que les droitiers et qu’ils ont une moyenne d’evaluation beaucoup plus elevee grace a leur nombre reduit, a l’exception des milieux de terrain.

CONCLUSION

Pour conclure, la visualisation nous a permi d’avoir une idée assez précise du contenu global de notre jeu de données, et sur quelle base certaines valeurs sont attribuées à certains individus. Les differents outils et packages utilises sont les suivants :